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LOGUE^^ ADENOVIRAUX ET METHODE DE REDUCTION DES EVENEMENTS DE RECOMBINAISON HOMO- 

La presente invention conceme une methode permettant de reduire les 
evenements de recombinaison entre acides nucleiques. EUe conceme egalement 
5 rapplication de cette methode dans des procedes de preparation d'acides nucleiques 
tels que des plasmides ou vecteurs viraux. L'invention conceme egalement de 
nouvelles constructions virales. 

La recombinaison entre acides nucleiques est un phenomene bien connu de la 
biologie moleculaire. La recombinaison est un mecanisme moleculaire par lequel de 

1 0 nouvelles combinaisons de materiel genetique sont generees, contribuant a revolution 
darwinienne en foumissant une source de materiel pour la selection naturelle. La 
recombinaison genetique necessitant une forte homologie de sequence entre les acides 
nucleiques participant est generalement designee recombinaison homologue. Lors de 
recombinaisons homologues, un echange d'information genetique se produit entre deux 

1 5 regions d'un acide nucleique, echange qui peut etre reciproque ("crossing over") ou 
non reciproque (conversion). 

Lors de la meiose, la recombinaison homologue est responsable du 
reassortiment de I'information genetique, et joue un role important dans la segregation 
correcte des chromosomes. Lors de la mitose, la recombinaison homologue participe a 
20 la reparation de I'ADN. EUe peut introduire des rearrangements genomiques, tels que 
des deletions et des duplications lorsqu'eUe implique des regions homologues 
dispersees, ou aussi des contractions ou expansions lorsqu'il s'agit de sequences 
repetees en tandem. 

Le mecanisme par lequel se produit la recombinaison homologue a ete en partie 
25 elucide. Ainsi, chez les bacteries, la recombinaison homologue commence par une 
etape faisant intervenir un bout simple-brin (HoUiday, 1964; Meselson, 1975), Chez les 
eucaryotes, en revanche, la plupart des resultats suggerent un mecanisme de cassure 
double-brin (DSB "double-strand break") (Szostak et al, 1983). Les DSB semblent 



wo 99/25861 



2 



PCT/FR98/02453 



etre a I'origine de deux mecanismes principaux de recombinaison homologue : I'un. 
conservatif. selon lequel toutes les sequences des acides nucleiques participant a la 
recombinaison se retrouvent presentes dans les produits de la recombinaison (Szostak 
et al). I'autre, non conservatif, au cours duquel certaines sequences sont perdues. Dans 
les ceUuIes somatiques mammiferes. la majorite des recombinaisons homologues par 
DSB semblent se faire selon un processus non-conservatif (Lin et al. 1990. Jeong-Yu, 
1992). 

Avec le developpement constant de la biotechnologie. une exploitation de plus 
en plus grande de I'ADN est effectuee : production de proteines recombinantes. 
creation d'animaux transgeniques. therapies genique et cellulaire, etc. Dans ces 
differents domaines. la realisation d'evenements de recombinaison non controles peut 
constituer dans certains cas un inconvenient. 

Ainsi, lors de la production de proteines recombinantes. des evenements de 
recombinaison dans le plasmide d'expression (recombinaison intramoleculaire) peuvent 
par exemple conduire a I'excision de la cassette d'expression du transgene. et ainsi a 
une perte de I'expression. Des evenements de recombinaison peuvent egalement etre a 
Torigine de Texcision d'une cassette d'expression stablement integree dans le genome 
d'une cellule hote productrice, et ainsi induire une perte de stabilite. 

Un autre exemple d'effets indesirables Ues a la realisation d'evenements de 
recombinaison homologue est susceptible de se produire lors de la construction et de 
la production de vecteurs, en particulier de vecteurs viraux. Les vecteurs viraux 
(adenovirus, retrovirus, virus adeno-associe, virus de I'herpes, etc) constituent des 
moyens particuUerement efficaces pour le transfert d'acides nucleiques dans des 
cellules, in vitro, ex vivo ou in vivo. Pour la construction de vecteurs viraux defectifs, 
les regions essentieUes a la repUcation du virus sauvage sont generalement deletees du 
genome, et remplacees par I'acide nucleique d'interet. Pour produire et amplifier ces 
virus, U est done necessaire de foumir en trans les fonctions de complementation (soit 
sur un plasmide, soit sous forme integree au genome de la ceUule productrice, soit par 
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un virus auxiliaire). Or, dans cenains cas, des evenements de recombinaison 
homologue surviennent entre le genome viral defectif et les fonctions de 
complementation, reconstituant des particules virales repUcatives. Ainsi. les vecteurs 
derives des adenovirus sont generalement produits dans une lignee de 
complementation (lignee 293 ou derivee) dans laqueUe une partie du genome de 
I'adenovirus a ete integree. Plus precisement. la Ugnee 293 contient Textremite gauche 
(environ 11-12%) du genome de Tadenovirus serotype 5 (Ad5). comprenant FITR 
gauche, la region d'encapsidation et la region El. incluant Ela. Elb. et une partie des 
regions codant pour la proteine pIX et IVa2. Cette Ugnee est capable de trans- 
complementer des adenovirus recombinants defectifs pour la region El. c'est-a-dire 
depourvus de tout ou partie de la region El. necessaire a la replication. Neanmoins, U 
existe des zones d'homologie entre la region de Tadenovirus integree dans le genome 
de la Ugnee et I'ADN du virus recombinant que I'on souhaite produire. De ce fait, au 
cours de la production, differems evenements de recombinaison peuvent se produire. 
generant des particules virales repUcatives, notamment des adenovirus de type E1+. 
Comme indique sur la figure 1, U peut s'agir d'un ^venement simple de recombinaison 
suivi d'une cassure du chromosome (figure lA), ou d'une double recombinaison (figure 
IB). Ces deux types de modification conduisent a remplacer la partie gauche de I'ADN 
recombinant, depourvue d'une region El fonctionnelle, par la partie correspondante 
presente dans le genome de la ceUule. qui porte une copie fonctionneUe de la region 
El. Par ailleurs, compte tenu des titres eleves de vecteur recombinant produits par la 
Ugnee 293, la probabiUte que ces evenements de recombinaison aient Ueu est elev^e. 
De fait, il a ete constate que de nombreux lots de vecteure adenoviraux recombinants 
defectifs etaient contamines par des particules virales repUcatives. 

La presence de particules repUcatives dans les lots de virus constitue un 
inconvenient important pour des applications pour le transfert de genes in vitro ou in 
vivo (risques de propagation virale et de dissemination incontrolee). 
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U meme type de problematique existe pour la generation de retrovirus 
defectifs. Ainsi. les retrovirus defectifs construits sont generalement deletes des 
regions virales codantes (gag. pol et env), qui sont apportees en trans par la Ugnee de 
production. Ici encore, pour certaines lignees decrites. des zones de recouvrement 
existent entre le genome du retrovirus defectif et les fonctions de complementation 
portees par la ceUules. C'est le cas en particuUer des ceUules PA317. Psi2. etc. Des 
evenements de recombinaison homologue sont done susceptibles de se produire au 
niveau de ces zones, generant des particules replicatives. 

La presente invention est relative a un precede permettant de reduire la 
frequence des evenements de recombinaison entre deux acides nucleiques donnes, et 
ainsi de minimiser I'impact de tels evenements sur un precede biologique. 

Plus particuUerement, la presente invention est relative a un procede permettant 
de reduire la frequence des evenements de recombinaison homologue entre deux 
acides nucleiques donnes ou deux regions d'un acide nucleique. 

Pour reduire les evenements de recombinaison homologue, I'art anterieur 
enseigne differentes approches. qui reposent toutes sur un meme principe : remplacer 
ou supprimer les regions d'homologie. Ainsi, certains plasmides permettant 
I'expression de genes d'interet portent des regions homologues au genome de la ceUule 
hote. II peut s'agir en particulier d'une region promoteur, d'un gene marqueur ou d'une 
engine de repUcation. Pour reduire les risques de recombinaison, il a ete propose 
jusqu'^, present de substituer ces regions par d'autres. non homologues (promoteur 
different, etc). D'autre part, pour limiter les risques de recombinaison dans les 
precedes de production de vecteurs viraux. il a ete suggere d'eliminer les sequences 
homologues entre les genes de complementation et le genome viral defectif. 



Ainsi. la demande de brevet WO97/00326 decrit une lignee ceUulaire de 
production d'adenovirus, designee PER, comprenant une unite restreinte du genome 



10 



15 



20 



25 



wo 99/25861 PCT/FR98/02453 

5 

adenoviral portant la region El. Avec cette Hgnee. les sequences flanquantes 
homologues au genome du virus defectif sont r^duites. ce qui permet de limiter les 
risques de recombinaison homologue entre ceux-ci. De la meme fagon. la demande 
W095/11984 decrit la construction d'un adenovirus recombinant portant une deletion 
de la region El etendue a une portion du gene pIX. Dans ce cas, ce n'est plus la region 
de complementation qui est modifiee (reduite), mais la deletion portee dans le genome 
defectif. qui est etendue. Le resultat est egalement une diminution des risques de 
recombinaison, meme si des regions d'homologie subsistent. 

Cependant, si ces approches permettent de reduire les risques de 
recombinaison emre la ceUule et le genome viral, et done les risques de produire des 
lots de virus contamines par des particules replicatives. eUes ne permettent pas de les 
eliminer totalement et/ou necessitent la constmction et done la validation de nouveUes 
lignees ceUulaires, ce qui est tres lourd. Par ailleurs. la substitution de regions par 
d'auires n'est pas forcement satisfaisante. notamment en terme d'efficacite. 

La presente demande decrit un nouveau procede permettant de reduire les 
evenements de recombinaison homologue inter- ou intramoleculaires. L'invention 
decrit egalement I'application de ce procede a la production de virus defectifs non 
contamines par des particules repUcatives. L'invention decrit egalement de nouveUes 
constructions virales capables d'etre amplifiees dans les Ugnees de production 
existantes les plus efficaces sur le plan du titre. avec des risques de generation de 
particules replicatives fortement reduits. 

L'etape initiate et importante de la recombinaison homologue est la 
reconnaissance entre les deux acides nucleiques partenaires (recombinaison 
intermoleculaire) ou entre deux regions d'un acide nucleique (recombinaison 
intramoleculaire). Cette etape est le resultat d'une interaction directe entre les deux 
regions homologues. La recombinaison homologue entre deux acides nucleiques est 
done basee sur I'existence d'une identite. ou d'une forte homologie de sequence entre 
deux regions de ces acides nucleiques. et eUe est generalement dependante de deux 
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facteurs : le degre d-homologie et la longueur de rhomologie (i.e. des regions 
homologues portees par le ou les deux acides nucleiques). Par ailleurs. la frequence de 
recombinaison homologue peut egalement etre influencee par certaines regions 
particulieres des acides nucleiques. Ainsi, il a ete observe que certaines regions etaient 
capables de recombiner avec une frequence plus 61evee que la frequence moyenne. II a 
par ailleurs ete determine que ces variations de frequence localisees pouvaient etre 
dues a des sequences particulieres telles que des sites CHI chez E. coli ou des sites 
M26 Chez 5". pombe (Gangloff et al., 1994). 

Contrairement aux strategies proposees dans I'art anterieur. le precede de 
rinvention ne passe pas par une suppression des zones d'homologie entre les acides 
nucleiques partenaires. Le procede de I'invention repose de maniere originale sur la 
modification de la sequence de I'un au moins des deux acides nucleiques partenaires de 
la recombinaison. de maniere a reduire rhomologie existant entre ces acides 
nucleiques. 

Un premier objet de I'invention conceme done un procede permettant de 
reduire la frequence des evenements de recombinaison homologue intra- ou 
intermoleculaire emre acides nucleiques caracterise en ce que la sequence de Tun au 
moins des acides nucleiques partenaires de la recombinaison est degeneree de maniere 
a reduire I'homologie avec le ou les autre(s) partenaires. 

On emend au sens de I'invention par "reduction de la frequence des evenements 
de recombinaison homologue" entre acides nucleiques tout abaissement de ladite 
frequence, par rapport a la frequence observee avec les acides nucleiques 
correspondants non modifies. Cette reduction peut etre mesuree aisemem par des tests 
classiques connus de I'homme du metier (en particuUer par des tests de "marker 
rescue" ou par des tests de generation de particules virales r^pKcatives). 
Avantageusement. le terme "reduction" s'entend d'une baisse significative de la 
frequence de recombinaison homologue. de preference d'une unite logarithmique au 
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On emend par recombinaison homologue intermoleculaire une recombinaison 
homologue entre deux acides nucleiques (ou entre deux regions de deux acides 
nucleiques) distincts. On emend par recombinaison homologue intramoleculaire une 
recombinaison homologue emre deux regions d'un meme acide nucleique. Par ailleurs. 
les acides nucleiques partenaires de la recombinaison homologue peuvem etre des 
acides nucleiques extrachromosomiques. chromosomiques. ou une combinaison des 
deux (i.e. un acide nucleique chromosomique et un acide nucleique 
extrachromosomique). Les acides nucleiques extrachromosomiques peuvem etre des 
plasmides, vecteurs, episomes, genomes viraux, etc. 

Le procede de I'invention est paniculieremem adapte pour reduire la frequence 
des evenemems de recombinaison homologue intermoleculaire emre un acide 
nucleique chromosomique et un acide nucleique extra-chromosomique. 

Le procede de I'invention implique generalement les etapes suivantes: 

(i) idemification de la ou des regions responsables de la recombinaison 
1 5 homologue 

(ii) modification de cette ou ces regions 

(iii) verification de la sequence 

(iv) synthese de la sequence modif iee (designee syngen) 

(v) remplacement de la sequence origineUe par le syngen 



20 



(i) L'idemification des regions responsables de la recombinaison homologue emre 
acides nucleiques est realisee par toute methode connue. En particuUer. des lors qu'un 
evenemem de recombinaison est observe, les regions qui en som responsables peuvem 
etre recherchees par analyse de sequence : recherche de regions homologues entre les 
acides nucleiques (intermoleculaire) ou au sein de I'acide nucleique (intramoleculaire). 
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Lorsque les sequences impHquees dans la recombinaison sont identifiees, une 
region est definie. comprenant tout ou une partie de ces sequences, qui est utilisee 
pour I'etape (ii) ci-apres, c'est-a-dire la modification. 

(ii) Modification de la sequence 

II est generalement admis que I'homologie doit etre tres forte sur une region 
suffisamment longue pour qu'un evenement de recombinaison puisse avoir lieu a une 
frequence significative. En particuUer, les donnees de la Utterature suggerent qu'une 
region d'ho"molbgie parfaite'rfune longueur au moins egale a environ 200 pb est 
requise pour la realisation de tels evenements. En effet, meme si des recombinaisons 
peuvent se produire sur des regions plus reduites. leur frequence est beaucoup plus 
faible et non reguHere. Par ailleurs, sur une teUe region dont I'homologie est reduite de 
19%. il semble que la frequence de recombinaison soit reduite d'un facteur 1000 
(Waldman et Liskay. 1987). 

U sequence peut etre modifiee de differentes manieres. S'agissant de sequence 
codante, des modifications peuvent etre apportees fondees sur la degenerescence du 
code genetique. Ainsi. la sequence est perturbee. et done I'homologie est reduite. mais 
le produit d'e.xpression est le meme. 

L'invention reside done en particulier dans une modification de la sequence de 
maniere a empecher rappariement entre les deux regions homologues. La modification 
permet de diminuer la longueur et le degre d'homologie entre les deux regions 
concemees. 

Avantageusement. dans le procede de l'invention. la sequence de I'acide 
nucleique est degeneree. au niveau de la region inripEquee dans la recombinaison 
homologue. a raison de 1 paire de bases au moins toutes les 20 paires de bases. Plus 
preferentiellement, eUe est degeneree a raison de 1 paire de bases au moins toutes les 
10 paires de bases. 
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Selon une variante particuUere de I'invention. la sequence est degeneree sur 
toutes les positions possibles. 

La degenerescence de la sequence selon I'invention est avantageusement 
realisee en fonction de Tusage des codons de la ceUule ou Forganisme chez lequel 
I'acide nucleique doit etre utilise. Dans le cas d'un vecteur viral dont la production est 
realisee dans une Ugnee de cellules humaines. il est particuUerement interessant de 
degenerer les sequences en favorisant I'usage prefere des codons chez rhomme lorsque 
ce choix est possible (voir exemples). 

Par ailleurs, des modifications supplementaires peuvent etre apportees a la 
sequence d'acide nucleique. Ainsi. dans les regions non codantes. il est possible de 
reduire la taille de cenains elements (sequences regulatrices de Texpression. 
promoteurs) ou de modifier ces elements ou de substituer certains autres elements par 
des regions heterologues . 

Selon une variante panicuUere de Tinvention, et lorsque la zone d'homologie 
s'etend sur plusieurs genes, U est possible de reduire la zone d'homologie d'une part, en 
degenerant la sequence de un ou plusieurs genes et, d'autre part, en modifiant la 
position genomique de cenains genes presents dans la zone d'homologie c'est a dire en 
pla^ant ces genes au sein du genome adenoviral et dans une position genomique autre 
que leur position d'origine. La sequence des genes dont la position genomique est 
modifiee peut en outre etre degeneree. De maniere preferee. seule la sequence des 
genes qui ne sont pas deplaces est degeneree. 

(iii) Verification de la sequence 

La verification est realisee par des methodes informatiques, permettant de 
detecter la presence d'elements de regulation, structures secondaires, etc, susceptibles 
d'interferer avec I'activite du syngen. Voir exemples. 
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(iv) Synthase du syngen 

Le syngen peut etre synthetise par toute technique connue de Thomme du 
metier, et notamment en utiUsant des synthetiseurs d'acides nucleiques. 



(v) remplacement de la sequence originelle par le syngen 

Le syngen, une fois synthetise, est ensuite introduit dans I'acide nucleique en 
remplacement de la sequence origineUe. Cette etape peut egalement etre realisee selon 
les techniques de biologie moleculaire classique bien connues de I'homme du metier. 

L'une des appUcations du precede de Tinvention reside dans la production de 
vecteurs, notamment de vecteurs viraux. depourvus de particules virales competentes 
pour la repUcation (RCV). A cet egard, le procede de I'invention vise plus 
particulierement a reduire la frequence des evenements de recombinaison homologue 
entre un acide nucleique chromosomique codant pour des fonctions de 
complementation d'un vims defectif et un acide nucleique extra-chromosomique 
comprenant le genome dudit virus defectif. 

Le virus conceme peut etre avantageusement un adenovirus, un retrovirus, un 
virus adeno-associe (AAV) ou encore un virus de Therpes. II s'agit plus 
preferentiellement d'un adenovirus. 

Ainsi. un mode de realisation particulier de I'invention consiste en un procede 
de reduction de la frequence des evenements de recombinaison homologue entre un 
acide nucleique chromosomique comprenant la region El d'un genome d'adenovirus 
ainsi qu'une region flanquante et un acide nucleique extra-chromosomique comprenant 
un genome d'adenovirus defectif pour la region El. 

Avantageusement, dans ce procede particuUer. la sequence degeneree selon 
I'invention comprend le gene pIX du genome de I'adenovirus defectif pour la region 
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El. Encore plus preferentieUement, la sequence degeneree comprend les genes pIX et 
IVa2 du genome de I'adenovirus. 

Selon une autre variante de realisation. la sequence degeneree comprend le 
gene pIX du genome de I'adenovirus, et la sequence du gene Iva2 est deplacee de son 
locus natural vers la region E4. 

Le procede de I'invention est particulierement adapte a la production 
d'adenovirus recombinants defectifs pour la region El dans la lignee ceUulaire 293 ou 
dans une lignee celluJaire derivee. 

Comme indique ci-avant. la Ugnee ceUulaire 293 contient dans son genome la 
partie gauche du genome de I'adenovirus comprenant notamment la region El et une 
region flanquante situee en aval (3') de la region El portant notamment le gene pIX et 
une partie du gene IVa2. C'est precisement au niveau de cette region flanquante que se 
produisent des recombinaisons homologues g^nerant des Adenovirus competents pour 
la repUcation (ACR). On entend au sens de I'invention par "Ugnee ceUulaire derivee" 
une Ugnee ceUulaire portant la region El de I'adenovirus et une region flanquante 
susceptible de donner Ueu a une recombinaison avec le virus defectif. II peut s'agir 
d'une region plus courte que ceUe presente dans 293 (Umitee ^ pIX par exemple) ou 
d'une region plus longue. Une lignee derivee peut egalement dtre une Ugnee construite 
a partir des ceUules 293, par introduction de sequences de complementation 
supplementaires (telles que E4). 

A cet egard, I'invention conceme egalement un procede de preparation 
d'adenovirus recombinants defectifs par introduction, dans une ceUule de la Ugnee 293 
ou dans une ceUule derivee. du genome dudit adenovirus recombinant defectif, 
caracterise en ce que ledit genome porte : 

- une deletion de la region El 



- une degenerescence dans les genes pIX e^ou IVa2. 
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L'invention conceme en outre tout vecteur viral dont le genome comprend 
une region au moins dont la sequence est degeneree. II pent s'agir notamment de 
retrovirus (portant des sequences degenerees dans les genes gag, pol et ou env) 
d'AAV (portant des sequences degenerees dans les genes rep et/ou cap) ou egalement 
5 d'adenovinis. 

II s'agit avantageusement d'adenovinis dont le genome porte \m gene pIX 
degenere. De preference, la sequence degeneree du gene pIX est la sequence ID N*=*l 
ou la sequence ID N"* 4. De preference encore, Tadenovirus comporte en outre ime 
modification de la position genomique du gene Iva2. Ce gene est avantageusement 
1 0 positionne au niveau de la region E4, 

Selon un autre mode de realisation, il s'agit d'un adenovirus dont les genes pIX 
et IVa2 sont degeneres. De preference, la sequence natureUe du gene pIX est 
remplacee par la sequence SEQ ID N° 1 ou la sequence SEQ ID N**4 et la sequence 
degeneree du gene IVa2 est la sequence SEQ ID N'*2 ou la sequence SEQ ID N^'S. De 
1 5 preference, la sequence natureUe des genes pIX et IVa2 est remplacee par la sequence 
SEQ ID N° 3. 

Selon un autre mode de realisation, il s*agit d'un adenovirus dont les genes pIX 
et IVa2 sont degeneres et qui comporte en outre des modifications de la sequence du 
promoteur du gene pIX et /ou un remplacement de la sequence de polyadenylation de 
20 ces genes. De preference, il s'agit d'un adenovirus comportant la sequence SEQ ID 

L*adenovirus porte en outre avantageusement au moins xme deletion de la 
region El. Plus preferentiellement, les adenovirus sont defectifs pour tout ou partie 
des regions El et E3 au moins. II peut s'agir egalement d*adenovirus recombinants 
25 defectifs pour les regions El et E4, en tout ou partie, et eventuellement poxir la region 
E3. Par aiQeurs, cet adenovirus peut etre de differents serotypes. Concemant les 
adenovirus d'origine humaine, on peut citer preferentiellement ceux classes dans le 
groupe C. 



wo 99/25861 



13 



PCT/FR98/02453 



Plus preferentieUement encore, parmi les differents serotypes d'adenovirus 
humain. on prefere utiliser dans le cadre de la presente invention les adenovirus de 
type 2 ou 5 (Ad 2 ou Ad 5). Parmi les differents adenovirus d'origine animate, on 
prefere utiliser dans le cadre de Tinvention des adenovirus d'origine canine, et 
notamment toutes les souches des adenovirus CAV2 [souche manhattan ou A26/61 
(ATCC VR-800) par exemple]. D'autres adenovirus d'origine animate sont cites 
notamment dans la demande W094/26914 incorporee a la presente par reference. Les 
strategtes de construction des adenovirus, ainsi que les sites utilisabtes pour 
I'introduction de genes d'interet dans ces vecteurs sont decrits en detail dans Fart 
anterieur. et notamment WO95/02697. WO96/10088, W096/13596 ou encore 
W096/22378. 

* 

Selon un mode particulierement avantageux. dans tes adenovirus recombinants 
de la presente invention, la region El est inactivee par deletion d'un fragment PvuII- 
BgUI allant du nucleotide 454 au nucteotide 3328. sur la sequence de Tadenovirus 
Ad5. Cette sequence est accessibte dans la litterature et egalement sur base de donnees 
(voir notamment Genebank n° M73260). Dans un autre mode de realisation prefere. la 
region El est inactivee par deletion d'un fragment HinfII-Sau3A allant du nucleotide 
382 au nucleotide 3446. 



Avantageusement. tes adenovirus recombinants de I'invention comportent 
outre une sequence d'acides nucteiques heterologue dont le transfert et/ou Texpress 
dans une cellute, un organe ou un organisme est recherche. 



en 
ion 



En particulier, la sequence d'ADN heterologue peut comporter un ou 
plusieurs genes therapeutiques et/ou un ou plusteurs genes codant pour des peptides 
antigeniques. 

Les genes therapeutiques qui peuvent ainsi etre transferes sont tout gene dont 
la transcription et eventueUement la traduction dans la ceUute cibte generent des 
produits ayant un effet therapeutique. 
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II peut s'agir en particulier de genes codant pour des produits proteiques 
ayam un effet therapeutique. Le produit proteique ainsi code peut etre une proteine, 
un peptide, un acide amine, etc. Ce produit proteique peut etre homologue vis-a-vis de 
la ceUuIe cible (c'est-a-dire un produit qui est normalement exprime dans la ceUule 
cible lorsque ceUe-ci ne presente aucune pathologie). Dans ce cas. I'expression d'une 
proteine permet par exemple de pallier une expression insuffisante dans la cellule ou 
I'expression d'une proteine inactive ou faiblement active en raison d'une modification, 
ou encore de surexprimer ladite proteine. Le gene therapeutique peut aussi coder pour 
un mutant d'une proteine ceUulaire. ayant une stabilite accrue, une activite modifiee. 
etc. Le produit proteique peut egalement etre heterologue vis-a-vis de la ceUule cible. 
Dans ce cas. une proteine exprimee peut par exemple completer ou apporter une 
activite deficiente dans la cellule lui permettant de lutter contra une pathologie. 

Parmi les produits therapeutiques au sens de la presente invention, on peut 
citer plus particuHerement les enzymes, les derives sanguins. les hormones, les 
lymphokines : interleukines, interferons, TNF. etc (FR 9203120). les facteurs de 
croissance. les neurotransmetteurs ou leurs precurseurs ou enzymes de synthese. les 
facteurs trophiques : BDNF, CNTF. NGF, IGF, GMF, VEGF, aFGF, bFGF. NT3. 
NT5, etc; les apolipoproteines : ApoAI. ApoAIV. ApoE. etc (FR 93 05125). la 
dystrophine ou une minidystrophine (FR 9111947), les genes suppresseurs de tumeurs 
: p53, Rb. RaplA. DCC. k-rev. etc (FR 93 04745). les genes codant pour des facteurs 
impliques dans la coagulation : Facteurs VII. VIII. IX. etc, le gene codant pour la 
proteine GAX, les genes suicides : thymidine kinase, cytosine desaminase. etc.. des 
genes codant pour des anticorps simple chaine (scFv) 

Le gene therapeutique peut egalement etre un gene ou une sequence antisens, 
dont I'expression dans la cellule cible permet de contrdler I'expression de genes ou la 
transcription d'ARNm ceUulaires. De telles sequences peuvent par exemple etre 
transcrites, dans la ceUule cible, en ARN complementaires d'ARNm cellulaires et 
bloquer ainsi leur traduction en proteine. selon la technique decrite dans le brevet EP 
140 308. 
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Comme indique plus haut. la sequence d'AJDN heterologue peut egalement 
comporter un ou plusieurs genes codant pour un peptide antigenique. capable de 
generer chez I'homme une reponse immunitaire. Dans ce mode particulier de mise en 
oeuvre. I'invention perniet done la realisation de vaccins permettant d'immuniser 
l-homme, notamment contre des microorganismes ou des virus. II peut s'agir 
notamment de peptides antigeniques specifiques du virus d'epstein barr. du virus HIV, 
du virus de Thepatite B (EP 185 573)/ du virus de la pseudo-rage, ou encore 
specifiques de tumeurs (EP 259 212). 

Generalement. la sequence d'acides nucleiques heterologue comprend 
egalement une region promotrice de la transcription fonctionneUe dans la ceUule 
infectee. II peut s'agir d'une region promotrice natureUement responsable de 
I'expression du gene considers lorsque ceUe-ci est susceptible de fonctiomier dans la 
cellule infectee. II peut egalement s'agir de regions d'origine differente (responsables de 
I'expression d'autres proteines. ou meme synthetiques). Notamment. il peut s'agir de 
sequences promotrices de genes eucaryotes ou viraux. Par exemple. ii peut s'agir de 
sequences promotrices issues du genome de la ceUule que I'on desire infecter. De 
meme. il peut s'agir de sequences promotrices issues du genome d'un virus, y compris 
I'adenovirus utilise. A cet egard. on peut citer par exemple les promoteurs des genes 
ElA. MLP, CMV. RSV. etc. En outre, ces regions promotrices peuvent etre modifiees 
par addition de sequences d'activation. de regulation, ou permettant une expression 
tissu-specifique ou majoritaire. Par aiUeurs. lorsque I'acide nucleique heterologue ne 
comporte pas de sequences promotrices. il peut etre insere dans le genome du virus 
defectif en aval d'une telle sequence. 

Par ailleurs, la sequence d'acides nucleiques heterologue peut egalement 
comporter, en particulier en amont du gene therapeutique, une sequence signal 
dirigeant le produit therapeutique synthetise dans les voies de secretion de la cellule 
cible. Cette sequence signal peut etre la sequence signal naturelle du produit 
therapeutique, mais il peut egalement s'agir de toute autre sequence signal 
fonctionneUe, ou d'une sequence signal artificielle. 
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Toujours dans un mode particuUerement avantageux. les vecteurs de 
I'invention possedent en outre un gene E3 fonctionnel sous controle d'un promoteur 
heterologue. Plus preferentiellement, les vecteurs possedent une partie du gene E3 
permettant I'expression de la proteine gpl9K. Cette proteine permet en effet d'eviter 
que le vecteur adenovirus fasse I'objet d'une reaction immunitaire qui (i) limiterait son 
action et (ii) pourrait avoir des effets secondaires indesirables. 

Ces vecteurs recombinants peuvent etre utilises pour le transfert d'acides 
nucleiques dans les cellules in vitro, ex vivo ou in vivo. 

La presente invention conceme egalement toute composition pharmaceutique 
comprenant un ou plusieurs adenovirus recombinants tels que decrits precedemment. 
Us compositions pharmaceutiques de I'invention peuvent etre formulees en vue d'une 
administration par voie topique, orale. parenterale. intranasal, intraveineuse. 
intramusculaire, sous-cutanee. intraoculaire, transdermique, etc. 

Preferentiellement, la composition pharmaceutique contient des vehicules 
pharmaceutiquement acceptables pour une formulation injectable. U peut s'agir en 
particulier de solutions salines (phosphate monosodique. disodique. chlorure de 
sodium, potassium, calcium ou magnesium, etc, ou des melanges de tels sels). steriles. 
isotoniques, ou de compositions seches, notamment lyophilisees. qui. par addition 
selon le cas d'eau sterilisee ou de serum physiologique. permettent la constitution de 
solutes injectables. 

Les doses de virus utilisees pour I'injection peuvent etre adaptees en fonction 
de differents parametres, et notamment en fonction du mode d'administration utilise, 
de la pathologie concemee, du gene a exprimer, ou encore de la duree du traitement 
recherchee. D'une maniere generale, les adenovirus recombinants selon I'invention sont 
formules et administres sous forme de doses comprises entre lO^ et 10l4 pfu/ml, et de 
preference 106 a lOlO pfu/ml. U terme pfu ("plaque forming unit") correspond au 
pouvoir infectieux d'une solution de vims, et est determine par infection d'une culture 
ceUulaire appropriee, et mesure, generalement apres 5 jours, du nombre de plages de 
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ceUules infectees. Les techniques de determination du titre pfu d'une solution virale 
sent bien documentees dans la litterature. 

La presente invention sera decrite plus en detail a I'aide des exemples qui 
suivent qui doivent etre consideres comme illustratifs et non limitatifs. 



Legende des Figures 

Figure 1 : Evenements de recombinaison entre radenovirus et la lignee 293 
Figure 2 : Structure schematique du syngen 
Figure 3 : carte de restriction du plasmide pJJ 105 
Figure 4 : carte de restriction du plasmide pJJ 110 
Figure 5 : carte de restriction du plasmide pJJ 206 

Figure 6 : construction du virus defectif portant le syngen en remplacement de la 
region naturelle. 

Figure 7 : Structure et carte de restriction des oligonucleotides OHgosyngen I et 
Oligosyngen IT. 

Figure 8 : Sequence nucleotidique natureUe et sequence degeneree du gene pIX (SEQ 
ID N^'l), et sequence correspondante d'acides amines. 

Figure 9 : Sequence nucleotidique natureUe et sequence degeneree du gene Iva2 (SEQ 
ID N''2), et sequence correspondante d'acides amines. 

Figure 10 : Sequence nucleotidique du syngen # 1 (SEQ ID N^'S) 
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Figure 11 : representation schematique des homologies entre le genome de la ceUule 
293 et des vecteurs Ad5 recombinants. U vecteur Ad5p53 presente une sequence 
d'homologie continue de 898 nucleotides avec le genome de la ceUules 293 en aval de 
la region El. L'introduction de mutations ponctueUes reduit la longueur maximale 
d'homologie continue a 92 nucleotides dans le cas du syngen # 1 (AV 1.7 # 1 CMV 
p53) et a 29 nucleotides dans le cas du syngen # 2 (AV 1.7 # 2 CMV lac Z). 

Figure 12 : Detection de ACR pour des vecteurs Ad5p53 et AV1.7 #1 p53 apres 7 
amplifications successives dans des cellules 293. 

Techniques generales de biologie moleculaire 

Us methodes classiquement utilisees en biologie moleculaire teUes que les 
extractions preparatives d'ADN plasmidique. la centrifugation d'ADN plasmidique en 
gradient de chlorure de cesium, I'electrophorese sur gels d'agarose ou d'acrylamide. la 
purification de fragments d'ADN par electroelution. les extraction de proteines au 
phenol ou au phenol-chloroforme, la precipitation d'ADN en miUeu salin par de 
I'ethanol ou de risopropanol. la transformation dans Escherichia coU. etc ... sont bien 
connues de I'homme de metier et sont abondament decrites dans la litterature [Maniatis 
T. et al.. "Molecular Cloning, a Laboratory Manual". Cold Spring Harbor Uboratory. 
Cold Spring Harbor. N.Y.. 1982; Ausubel F.M. et al. (eds). "Current Protocols iri 
Molecular Biology". John Wiley & Sons, New York. 1987]. 

Us plasmides pIC-20R (Invitrogen) et pBS (Stratagen) sont d'origine 

commerciale. 

Pour les Ugatures, les fragments d'ADN peuvent etre separes selon leur taille 
par electrophorese en gels d'agarose ou d'acrylamide. extraits au phenol ou par un 
melange phenol/chloroforme, precipites a I'ethanol puis incubes en presence de I'ADN 
ligase du phage T4 (Biolabs) selon les recommandations du foumisseur. 
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Le remplissage des extremites 5' proeminentes peut etre effectue par le 
fragment de Klenow de I'ADN Polymerase I d'E. coU (Biolabs) selon les specifications 
du fournisseur. La destruction des extremites 3' proeminentes est effectuee en presence 
de I'ADN Polymerase du phage T4 (Biolabs) utilisee selon les recommandations du 
fabricant. La destruction des extremites 5' proeminentes est effectuee par un traitement 
menage par la nuclease Si. 

La mutagenese dirigee in vitro par oligodeoxynucleotides synthetiques peut 
etre effectuee selon la methode developpee par Taylor et al. [Nucleic Acids Res. 13 
(1985) 8749-8764] en utilisant le kit distribue par Amersham. 

L'amplification enzymatique de fragments d'ADN par la technique dite de PGR 
[Polymerase-cataiyzed Chain Reaction. Saiki R.K. et al.. Science 230 (1985) 1350- 
1354; Mullis KB. et Faloona F.A.. Meth. Enzym. 155 (1987) 335-350] peut etre 
effectuee en utilisant un "DNA thermal cycler" (Perkin Elmer Cetus) selon les 
specifications du fabricant. 

La verification des sequences nucleotidiques peut etre effectuee par la methode 
developpee par Sanger et al. [Proc. Natl. Acad. Sci. USA. 74 (1977) 5463-5467] en 
utilisant le kit distribue par Amersham. 

Lignees cell ulaires utilispi^ 

- Lignee de rein embryonnaire humain 293 (Graham et al.. J. Gen. Virol. 36 
20 (1977) 59). Cette lignee contient notamment, integree dans son genome, la partie 
gauche du genome de I'adenovirus humain Ad5 (12 %). 

Exemple 1 : Recombinaison homologue dans I'adenovirus 

L'observation que le genome de I'adenovirus peut subir des recombinaisons 
genetiques a ete rapportee il y a plus de 25 ans (Williams et Ustacelibi. 1971). 
25 Toutefois. les mecanismes soutenant ces recombinaisons sont assez peu elucides. II a 
ete propose que la recombinaison et la replication puissent etre intimement Kees, et 
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certaines donnees sont en faveur dW modele de recombinaison dans lequel la 
replication produirait les substrats specifiques necessaires pour les recombinaisons 
frequentes obsec.ees lors de I'infection par I'adenovirus. L'una des questions est de 
savoir si des proteines virales ou ceUulaires participent i la formation des 
mtermediaires de la recombinaison et dans leur resolution en produits recombinants 
fmls. A cet egard. aucun des genes viraux testes n'a et6 montre comme implique dans 
les evenements de recombinaison : Elb. E4. Ela. E3 (Epstein. 1991; Weinberg et al.. 
1986; Young, 1995). De la meme maniere aucune proteine ceUulaire n'a pu etre misJ 
en evidence. Deux modeles ont fmalement ete proposes pour le mecanisme de 
recombinaison dans le genome adenoviral, predisant tous deux la formation 
d'heteroduplex etendus (Ahem et al.. 1991; Young, 1995). 

Us regions responsables de la recombinaison homologue entre le genome 
defectif et la lignee ceUulaire om ete localises notamment au niveau des genes pIX et 
IVa2 du genome de Tadenovirus. U structure de cette region presente dans le genome 
1 5 defectif est representee sur la figure 2. 

Des modifications de la sequence du genome de I'adenovirus impHquee dans la 
recombinaison avec le genome ceUulaire ont ete realisees. Plus precisement. la 
sequence naturelle des genes pIX et IVa2 a ete modifiee par intn)duction de mutations 
silencieuses, permettant de reduire I'homologie avec la sequence naturelle, sans 
20 affecter la structure des produits d'expression de ces genes. 

La sequence obtenue, designee syngen. est utilises en remplacement de la 
sequence naturelle correspondante de I'adenovirus. pour construire le vecteur defectif. 



25 




Des etudes de cartographie ont montre que la partie du genome de Tadenovirus 
presente dans le genome des cellules 293 correspondait i la partie gauche du genome 
adenoviral, et representait environ 12% de celui-ci. soit environ 4300 pb (AieUo et al.. 
1979; Spector et al. 1983). La demanderesse a realise des experiences de cartographie 
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supplementaires par PCR. et a montre que la position 4420 etait presente dans le 
genome de 293. Cette position 4420 a ete choisie pour les experiences suivantes 
comme la limite droite de la zone d'homologie, et done la limite droite du syngen. Pour 
des raisons techniques de clonage, le fragment modifie s'etendra jusqu'a la position 
4445 ou un site de clonage a ete introduit. 

L'extremit^ gauche du syngen a ete choisie dans les elements de regulation de 
I'expression du gene pIX et. plus particulierement, en position -56 du gene pIX. II a en 
effet ete montre que le promoteur du gene pIX pouvait etre reduit a une region de 56 
nucleotides. L'activite de cette region, contenant le site de liaison SPl et la boite 
TATA est comparable a celle du fragment de 250 nucleotides (Babiss et al., 1991; 
Matsui etal., 1989). 

La zone d'homologie a done ete determinee comme s'etendant de la position 
3520 a la position 4445 du genome du virus defectif (Voir figure 2). 

2. Design de sequences modifiees 

Une table d'usage des codons dans le genome de I'adenovinis Ad5 a 6te realisee 
par la demanderesse et utilisee afin de determiner I'usage optimum des codons pour 
•■expression des proteines virales. Cette table a ete obtenue en combinant les donnees 
obtenues d'apres I'analyse de 10 proteines de I'adenovirus : pIX, Hexon. pIII, pVII, 52- 
55k. pPol. pTP. DBF. 23K et 19k (voir table). Us resuhats obtenus ont ensuite ete 
compares avec une table d'usage des codons humains obtenue par analyse de 1952 
genes presents dans la base Genbank en utilisant le programme GCG. 

Un ordre de preference de I'utilisation des codons a alors ete etabU pour 
modifier la sequence codante des genes pIX et IVa2 : 

. Lorsque le codon utilise dans la sequence natureUe n'est pas le codon prefere. 
celui-ci est utilise dans le syngen. 
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. Lorsque le codon utilise dans la sequence natureUe est le codon prefere. 
alors le deuxieme codon prefere qui est utilise. 



cest 



. Dans certains cas, par exemple pour I'introduction d'un site de restriction, le 
troisidme codon prefere peut etre utilise, en particuUer lorsque sa frequence est 
suffisamment proche de celle du deuxieme codon prefere. 

Le tableau ci-dessous indique la frequence d'usage des codons chez rHomme et 
Chez I'adenovirus (ADV5) avec I'ordre de preference chez rHomme (colonne A). 

du syngen (colonne C) 

Table 1 : frequence d'utilisation des codons 



F 
F 
L 
L 



TTT 
TTC 
TTA 
TTG 



Phe 



Leu 



ADV5 



Huma 



H 



n 



2,3 


54.2% 


1.5 


43.0% 


1 


2 




1.9 


45.8% 


2,1 


57.0% 


2 


1 




0.1 


1.4% 


0,6 


6,0% 


6 


6 


6 


1.2 


14.2% 


1.1 


12.0% 


4 


4 


4 



L 
L 
L 
L 



CTT 
CTC 
CTA 
CTG 



Leu 



1.3 


15.6% 


1.1 


12.0% 


3 


3 


3 


1,7 


20,5% 


1.9 


20.0% 


2 


2 


2 


1.1 


12.6% 


0.6 


7.0% 


5 


5 


5 


3 


35.6% 


4 


43,0% 


1 


1 


1 



I ATT De 

I ATC 

I ATA 

M ATG Met 

V GTT Val 



1.3 


34,6% 


1.5 


1.6 


43,8% 


2.3 


0,8 


21,6% 


0.7 


2,6 


100,0% 


2.2 


0.8 


13.1% 


1 



35,0% 2 2 2 

52,0%> 1 1 1 

14,0% 3 3 3 
100.0% 

17.0% 3 3 3 
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V GTC 

V GTA 

V GTG 



Y 

Y 
# 



TAT 
TAG 
TAA 
TAG 



Tyr 



end 



23 

1.4 22.2% 
0.8 12.5% 
3,3 52,2% 

0.8 21,6% 
3 78,4% 



1.5 25.0% 2 
0.6 10,0% 4 
2,9 48,0% 1 



1,2 41.7% 

1.7 58,3% 

0.1 23,8% 

0,1 16,7% 



2 
1 



2 
4 
1 

2 
1 



2 
4 
1 

2 
1 



H CAT His 0,5 21.3% 

H CAC 1,7 78,7% 

Q CAA Gin 1,1 27,4% 

Q CAG 3 72,6% 



1.4 59,3% 2 1 

1 40,7% I 2 

1.2 26,7% 2 ■ 2 

3.3 73.3% 1 1 



2 
1 



N AAT Asn 1,2 24.5% 

N AAC 3,6 75,5% 

K AAA Lys 1,4 35.2% 

K AAG 2,5 64.8% 



1,6 43.5% 2 2 2 

2.1 56,5% 1 1 1 

2.2 39,8% 2 2 2 
3.4 60.2% 1 1 1 



D GAT Asp 1,6 29.2% 

D GAG 3,9 70,8% 

E GAA Glu 2,4 37,0% 

E GAG 4,1 63,0% 



2.1 44,2% 2 2 2 

2.7 55,8% 1 1 1 

2.8 41,5% 2 2 2 

3.9 58.5% 1 1 1 



S 
S 
S 
S 



TCT 
TCC 
TCA 
TCG 



Ser 



P OCT Pro 



0,8 11.7% 

1,7 25.9% 

0,6 9,6% 

0,9 13.6% 



1,4 18,0% 4 3 3 

1.7 23,2% 2 2 2 

1.1 14,7% 5 4 4 

0.4 5,9% 3 6 5 



1.2 18,4% 1,8 29.0% 4 
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p 


CCC 




2.7 


39.9% 


2.1 


33.0% 


1 


1 


1 


p 


CCA 




1.3 


18.7% 


1,7 


27.0% 


3 


3 


3 


p 


CCG 




1,5 


23.0% 


0.1 


11.0% 


2 


4 


4 


T 


ACT 


Thr 


1.1 


17.7% 


1.3 


23.0% 


2 


3 


2 


T 


ACC 




3.3 


55.0% 


2.2 


38,0% 


1 


1 


1 


T 


ACA 




0,8 


12.8% 


1,5 


27,0% 


4 


2 


4 


T 


ACG 




0,9 


14.5% 


0.1 


12.0% 


3 


4 

.. . i»f 


3 


A 


GCT 


Ala 


1,2 


13.7% 


2 


28,0% 


3 


2 


2 


A 


GCC 




4 


45,7% 


2,8 


40,0% 


1 


1 


1 


A 


GCA 




1,1 


12.6% 


1,6 


22.0% 


4 


* 

3 


3 


A 


GCG 




2,4 


27,9% 


0,7 


10.0% 


2 


4 


4 


C 


Cys 


TGT 


0,3 


21.5% 


1 


41,8% 


2 


2 


2 


C 




TGC 


1,1 


78.5% 


1.4 


58,2% 


1 


1 


1 


* 


end 


TGA 






0,3 


61.9% 








W 


Trp 


TGG 


1,3 


100.0% 


1.5 


100,0% 








R 


Arg 


CGT 


0,8 


10.4% 


0,5 


9,3% 


3 


6 


6 


R 




CGC 


4,1 


52.4% 


1.1 


19,4% 


1 


3 


1 


R 




CGA 


0,6 


7.0% 


0,6 


10,0% 


5 


5 


5 


R 




CGG 


1,1 


13.9% 


1 


18.6% 


2 


4 


2 


S 


Ser 


AGT 


0,4 


6.6% 


1 


13,6% 


6 


5 


6 


s 




AGC 


2,1 


32.6% 


1.9 


24,7% 


1 


1 


1 


R 


Arg 


AGA 


0,5 


6.2% 


1.2 


21,0% 


6 


2 


4 


R 




AGG 


0,8 


10,2% 


1.2 


21,7% 


4 


1 


3 


G 


Gly 


GGT 


1 


17,7% 


1.4 


18,3% 


4 


4 


4 
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G 
G 
G 



GGC 
GGA 
GGG 



2.4 41,3% 2,5 33.2% 1 i i 
1,3 21,5% 1,9 25,7% 2 2 2 
1.1 19,4% 1,7 22.8% 3 3 3 



Dans un premier exemple precis de syngen (syngen # 1). les modifications 
suivantes ont ete apportees: 

5 - Dans le promoteur pIX : la sequence a ete reduite autant que possible : le 

fragment retenu ne contient que 56 nucleotides, au Ueu de 135 nucleotides dans le 
vecteur originel. Une modification supplementaire peut etre apportee par modification 
des 9 nucleotides situes entre le site de liaison SPl et la boite TATA. 

- Dans le gene pIX : Toutes les positions ont 6te degenerees, quand cela etait 
1 0 possible, suivant la regie definie ci-dessus, sans modification de la sequence d'acides 

amines resultante (SEQ ID N° 1). La comparaison de la sequence naturelle et de la 
sequence degeneree ainsi que la struture du produit d'expression de ces sequence sont 
presentes dans la figure 8. Selon une autre strategic. seuJement une position (pb) sur 
10 est degeneree. Toujours selon une strategic alternative, seulement une position sur 
15 20. 

- Dans la region intervaUe entre pIX et IVa2 : la sequence de cette region, de 
59 nucleotides, n'a pas ete modifiee dans cet exemple. 

- Dans le gene IVa2 : La sequence codante du gene IVa2 a ete degeneree 
selon la regie definie ci-dessus, toutes les 20 pb. sans modification de la sequence 

20 d'acides amines resultante (voir SEQ ID N» 2). La sequence natureUe, la sequence 
degeneree et la sequence d'acides amines resultante sont presentees dans la figure 9. 
Selon une autre strategic, une position (pb) sur 10 est degeneree ou meme toutes les 
positions, toujours sans modification de la sequence d'acides amines resultante. 



wo 99/25861 



PCT/FR98/02453 



26 

La structure du syngen # 1 est decrite schematiquement sur la figure 2. La 
sequence du syngen # 1 est representee sur la figure 10 et par la sequence SEQ ID 
3. 

Un autre exemple de syngen est foumi par le syngen #2 dans lequel : 

5 - la sequence du promoteur du gene pIX a ete remplacee par une sequence 

modifiee telle que decrite en SEQ ID W 6. 

- la S§q?ueBQ§^u g^e^I^^ a.et6*remp^ selon U ^^jiMice decnte en SEQ " 
ID N° 4 sans modification de la sequence d'acides amines resultante. 

- la sequence du gene IVa2 a ete remplacee selon la sequence decrite en SEQ 
10 ID N"* 5 sans modification de la sequence d'acides amines resultante. 

- La region de polyadenylation a ete remplacee par la region qui remplit les 
memes fonctions au sein de I'adenovirus de type 7 (Ad 7) ; un adenovirus du sous 
groupe B qui est utilise comme vecteur pour le transfert de genes (Abrahamsen et al, 
1997, J. Virol 71.8946-8951). Cette sequence est decrite dans la sequence SEQ ID 

15 N^7. 

Lensemble de la sequence modifiee est appelee syngen #2 et est represente par 
la sequence SEQ ID N°8. 



3. Verification de la sequence des svngen 

Les caracteristiques de base des sequences naturelles et des syngen sent 
verifiees par analyse informatique. Cette verification a pour but de recherche la 
presence eventuelle. dans les syngen, de structures particulieres, et notamment : 

. de sites donneurs ou accepteurs d'epissage (programmes Splice View et/ou 
Splice Net) 
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. de sites de polyadenylation (programme Hcpolya) 

. de sites potentiels de liaison de facteurs transcriptionnels (programme 
Transfac) 

. de regions susceptibles de former des structures secondaires particulieres de 
type repetitions directes, epingle (programme Sigscan, BNL), y compris dans les 
ARNs conrespondants (RNA folding) 

. de sites consensus de type CHI ou M26. 

Lorsque de teUes sequence sont identifiees, les bases correspondantes peuvent 
eventuellement etre remplacees selon la strategic definie en 2. ci-avant. 

4. Construction de viru s defectifs portant le svngen # 1 en remplacement de la region 
naturelle conrespondante 

1. Materiel de depart : 

. Le syngen # 1 (SEQ ID N° 3) 

. Les oligonucleotides Syngen I et Syngen II correspondant respectivement 
aux extremites 5' et 3' du syngen # 1 sont donnees dans la figure 7. 

. Plasmide pJJ105 (figure 3) 

. Plasmide pJJl 1 0 (figure 4) 

. Plasmide pIC-20R (Invitrogen) 

. Plasmide pSyngen : syngen clone dans pBS (Stratagene) 

2. Construction du genome viral defectif 
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La strategie de construction est decrite sur la figure 6. 

Le plasmide pJJllO est digere par Xbal, et les fragments Xbal resultant de 4,8 
et 5,0 kb sont ligatures pour former le plasmide pJJ201. Le plasmide pJJ201 est 
ensuite digere par BstEII et Xmal. rempli et ligature, pour former le plasmide pJJ202. 
5 Les deux sites BstEII et Xmal sont conserves, 

Le produit d'amplification par PGR correspondant au fragment 1 du gene IVa2 
(Fgtl IVa2, figure 6) est genere en utilisant Toligo syngen I et I'oligo syngen II et le 
plasmide pJJ 105 comme matrice. 

Sequence de I'oligo syngen I (SEQ ID N°9) 

10 AACTGCAGGCCGGCCACTAGTCGCGATGTTCCCAGCCATATCCC 
Sequence de Foligo syngen II (SEQ ID N^'IO) 

CCGCTCGAGGTGACCGCTAGCCATTATGGACGAATGC 

Le fragment amplifie est insere dans le site Smal de pIC-20R pour generer 
pJJ203. Un fragment contigu du gene IVa2 du plasmide pJJ105 (Fragment 2 
1 5 identifie Fgt2 Iva2 dans la figure 6) est excise par Nsil / BstEII puis insere aux sites 
correspondants de pJJ203 pour generer pJJ204. Le syngen est ensuite digere par Fsel 
/ Nrul (figure 6) et insere entre les sites correspondants de pJJ204 pour generer 
pJJ205. 

Le fragment complet (syngen#l-Fgtl+2 IVa2) de pJJ205 est digere par Sse 
20 83871 / BstEII et insere aux sites correspondants dans pJJ202 pour generer pJJ206 
(figure 5). 

Ce fragment est ensuite utilise pour preparer un plasmide procaryote 
comprenant un genome d'adenovirus modifie (defectif pour El et eventuellement E3) 
contenant le syngen # 1, selon la methode decrite dans Crouzet et al (PNAS (94) 
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1414-1419 (1997)). Le plasmide obtenu est ensuite transfecte dans les ceUules 293 
pour prcxluire les virus correspondants. 

Une experience a ete menee pour comparer la capacite d'emergence des ACR 
(Adenovirus competent pour la repUcation) lors de la propagation a I'aide de la ceUule 
293 de deux virus AV1.7#lCMVp53 et l'Ad5CMVp53. 

Un vecteur (AV1.7#lCMVp53) muni de la sequence SEQ ID n°3 (syngen # 
1) et arme d'une cassette d'expression p53 (CMV-p53-polyASV40) a ete construit 
selon Crouzet etal (PNAS (94) 1414-1419 (1997). 

Ad5CMVp53 contient les regions de pIX-IVa2 de I'AdS (non modifiees). La 
cassette d'expression p53 est isogenique pour les deux virus. Les deux virus 
AV1.7#lCMVp53 et rAd5CMVp53 ont une productivite similaire dans la cellule 293. 
Pour chacun des virus, 5 plages ont ete purifiees sur la ceUule 293. Les 2x5 plages ont 
ete amplifies au cours de 7 passages successifs. A Tissue de cette amplifications, les 
2x5 echantillons du passage 7 ont ete analyse dans une experience de detection des 
ACR. L'experience a ete effectuee en triplicate. Les resultats sont presentes dans la 
figure 12. 

La methode de detection des ACR est une methode quantitative qui permet 
de compter des plages dont.Ie nombre correspond au nombre de ACR dans la dose de 
I'echantillon teste. Une dose donnee de virus d'un echantiUon (classiquement 3x10 10 
pv) est utilisee pour infecter un tapis ceDulaire d'une ceUule non-transcomplementante 
(cad n'exprimant pas El, en I'occurence la cellule A549) sur lequel est depose une 
couche d'agar. Apres 14 jours, on observe la formation de plage au sein du tapis 
lorsque la dose infectant de depart contient des ACR. 

Us resultats de l'experience de detection des ACR menee en triplicate sont : 0 
RCA pour AV1.7#lCMVp53 et 6 RCA pour I'AdSCMVpSS. Ce resultat est 
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statistiquement significatif lorsque I'on utilise une methode statistique de comparaison 
faisant appel a la probabilite conditionnelle de I'observation. On observe une 
ameboration statistiquement significative en faveur du vecteur AV1.7#lCMVp53 en 
terme de reduction de I'emergence de ACR lors de la propagation dans la cellule 293 
5 de ce vecteur compare a un vecteur classique. L'ensemble de ces resultats permettent 
de montrer que la presence du syngen n'affecte pas les titres de virus produits, que les 
lots de virus comportant le syngen # 1 sont depourvus de contamination par ACR. 



5. Fonctionnalite de virus defectifs oortant le svneen # 2 en 
"^0 remplacement de la region naturelle correspondante 

De la meme fagon, U a ete construit, un vecteur similaire avec le syngen # 2 
et arme d'une cassette d'expression LacZ (CMV-UcZ) : AV 1.7 #2CMV lacZ. La 
productivite de ce vecteur a ete comparee a ceUe d'un vecteur arm6 d'une cassette 
LacZ (RSV LacZ) dont les regions pIX et Iva2 n'ont pas ete modifiees (sequence 
15 de l'Ad5 sauvage) : AVl.O RSV lacZ. La productivity des deux vecteurs AV 1.7 
#2CMV lacZ et AVl.O RSV lacZ a ete testee en parallele dans des ceUules 293. 
Les resultats sont presentes dans le tableau ci-dessous. 





AV 1.7#2CMV lacZ 


AVl.O RSV lacZ 


Titre Stock 1 


1.1210'^ 


1.50 10'^ 


(pv/ml) 






Titre Stock 2 


1.52 10'- 


1.82 10^2 


(pv/ml) 






Productivite (pv/cellule) 


10133 


12133 


testee sur Stock 2 
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Productivite (tdu/cellule) 
testee sur Stock 2 


203 


207 



Ces resultats montrent que le syngen #2 presentant une homologie plus 
reduite que le syngen #1 et qui contient, outre des mutations sUencieuses au niveau 
des gene pIX et Iva2, des modifications au niveau des regions non codantes (i.e. au 
niveau du promoteur du gene pIX et des sequences de polyadenylation imbriquees 
de pIX et Iva2 ) ; un tel syngen, lorsqu'U est introduit en remplacement des 
sequences sauvages de I'adenovirus de type 5, s'avere etre viable et assurer une 
productivite elevee. 

6. Construction de virus defectifs dans lesquels seule la seq tienre 
naturelle du gene pIX e st remplacee par la sequence degeneree decrite en SRQ 
ID N°l et la partie de la region h o mologue correspondant au gene IVa2 est 
deplacee dans la region E4 . 

Selon une autre variante de realisation, seule la sequence naturelle du gene 
pIX est remplacee par la sequence degeneree decrite en SEQ ID N°l et la partie de 
la region homologue correspondant au gene IVa2 est deplacee dans la region E4. 
Le clonage du gene Iva2 a 6te decrit dans la demande WO96/10088 incluse ici par 
reference. 

Un premier plasmide nomme pIEll a ete construit et contient les 3 regions 
suivantes donees dans un plasmide colEl porteur des genes KanR et SacB : 

- un produit de PGR fait sur 1' Ad5 avec les amorces : 



5'-atcgatcgATAACAGTCAGCCTTACC-3' et 
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5'-agctgaattcCATCATCAATAATATACC-3'; 

ce produit de PGR contient I'lTR droite et le protnoteur de E4 jusqu'a I'ATG d'orfl 
non inclus (nucleotides 35525 a 35937) 

- le cDNA du gene IVa2 decrit dans la demande de brevet WO/9610088. 

- le fragment Xcml-EcoRV d'Ad5 contenant les sequences necessaires pour 

I'epissage d'orf6 de E4 et la sequence codante d'orf6 jusqu'au site EcoRV. 

Le cDNA de IVa2 dans le plasmide pIEll est precede d'un ATG excedentaire. Ce 
site est detruit sur le plasmide pIEll par mutagenese dirigee a I'aide d'un kit 
Transfomer Site-directed mutagenesis de Clontech pour former le plasmide pIE12 
dans lequel cet ATG a ete detruit. 

Le plasmide pIE12c deriv6 du plasmide pIE12 contient un genome d'adenovirus 5 
modifie de la fa§on suivante: deplacement du gene de la IVa2 de son locus naturel 
vers la region E4. remplacement des orfl a 4 de E4 au profit du cDNA de IVa2. 
deletion de E3, insertion d'une cassette RSV-lacZ en lieu et place de El. U 
plasmide pIE12c a ete obtenu par recombinaison avec le plasmide pXL2788BGal 
tel que decrit dans la demande WO 96/10088 en utilisant la technologie decrite 
dans Crouzet et al (PNAS (94) 1414-1419 (1997)) incluse ici par reference. 

Apres digestion enzymatique par Pad, le plasmide pIE12c a ete transfect^ dans 
293 et le virus obtenu amplifie. On observe que le profU de restriction du virus 
AdIE12 est celui attendu. 

Les analyses effectuees sur les lots de virus produits permettent de montrer 
que la presence de la sequence degeneree du gene pIX en lieu et place de la 
sequence natureUe et le deplacement du gene IVa2 dans la region E4 n'affecte pas 
les titres de virus produits et que les lots de virus sont depourvus de contamination 
par ACR lorsque ceux ci sont testes dans les conditions decrites ci-avant. 
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LISTE DE SEQUENCES 



(1) INFORMATIONS GENERALES : 

(i) DEPOSANT: 

(A) NOM: RHONE-POULENC RORER 

(B) RUE: 20, avenue Raymond Aron 

(C) VILLE: ANTONY 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 92165 

(H) TELECOPIE: 01 55 71 72 .9.1 ^ > ^ * 

(ii) TITRE DE L' INFVENTION: Methode de reduction des evenements 

de 

recombinaison homologue 
(iii) NOMBRE DE SEQUENCES: 

(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D* EXPLOITATION: PC-DOS /MS -DOS 

(D) LOGICIEL: Patentln Release j^l.O, Version #1.30 (DEB) 

C2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR; 424 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 



( ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 1 . . 424 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1 : 

ATG TCC ACG AAT TCC TTT GAC GGC TCC ATC GTC TCC AGC TAG CTG ACC 48 

Met Ser Thr Asn Ser Phe Asp Gly Ser lie Val Ser Ser Tyr Leu Thr 
^5 10 15 
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ACC CGG ATG CCT CCC TGG GCT GGC GTC CGC CAA AAC GTC ATG GGA AGC 
Thr Arg Met Pro Pro Trp Ala Gly Val Arg Gin Asn Val Met Gly Ser 
20 25 30 

TCC ATC GAC GGC AGG CCT GTG CTC CCT GCC AAT AGC ACC ACT CTG ACT 
Ser He Asp Gly Arg Pro Val Leu Pro Ala Asn Ser Thr Thr Leu Thr 
35 40 45 

TAT GAA ACT GTC AGC GGC ACC CCA CTG GAA ACC GCC GCA AGC GCT GCA 
Tyr Glu Thr Val Ser Gly Thr Pro Leu Glu Thr Ala Ala Ser Ala Ala 
^0 55 60 

GCC AGC GCT GCC GCC GCT ACT GCT CGG GGC ATC GTC ACC GAT TTC GCC 
Ala Ser Ala Ala Ala Ala Thr Ala Arg Gly He Val Thr Asp Phe Ala 

70 75 80 

TTT CTC TCC CCT CTG GCC TCC AGC GCT GCC AGC CGC AGC TCT GCT CGG 
Phe Leu Ser Pro Leu Ala Ser Ser Ala Ala Ser Arg Ser Ser Ala Arg 

85 90 95 

GAC GAT AAA CTG ACC GCC CTG CTG GCT CAG CTG GAC AGC CTG ACT AGG 
Asp Asp Lys Leu Thr Ala Leu Leu Ala Gin Leu Asp Ser Leu Thr Arc 

105 no 

GAG CTG AAC GTG GTG AGC CAA CAA CTC CTG GAC CTC CGG CAA CAA GTG 
Glu Leu Asn Val Val Ser Gin Gin Leu Leu Asp Leu Arg Gin Gin Val 
115 120 125 

AGC GCT CTC AAA GCC TCT AGC CCA CCT AAC GCC GTT TAA A 
Ser Ala Leu Lys Ala Ser Ser Pro Pro Asn Ala Val * 

135 140 



96 



144 



192 



240 



288 



336 



384 



424 



(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 357 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT : 1 . .354 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

ATC GCG AAC CTA AAA ATA CAG TCC AAG ATG CAT CTG ATA TCC CCA CGT 48 
He Ala Asn Leu Lys He Gin Ser lys Met His Leu He Ser Pro Arg 
1 S }Q T5 



ATG CAC CCC TCC CAG CTT AAC CGC TTC GTA AAC ACT TAC ACC AAG GGA 
Met His Pro Ser Gin Leu Asn Arg Phe Val Asn Thr Tyr Thr Lys Gly 
20 25 30 



96 



CTG CCC CTG GCA ATC AGC CTG CTA CTG AAA GAC ATT TTC AGG CAC CAC 144 
Leu Pro Leu Ala He Ser Leu Leu Leu Lys Asp He Phe Arg His His 
35 40 45 

GCC CAG CGG TCC TGC TAC GAC TGG ATT ATC TAC AAC ACC ACT CCG CAG 192 
Ala Gin Arg Ser Cys Tyr Asp Trp He He Tyr Asn Thr Thr Pro Gin 
50 55 60 

CAT GAA GCT CTC CAG TGG TGC TAC CTC CAT CCC AGA GAC GGG CTT ATG 240 
His Glu Ala Leu Gin Trp Cys Tyr Leu His Pro Arg Asp Gly Leu Met 
^5 70 75 80 

CCT ATG TAT CTG AAC ATC CAG AGC CAC CTT TAC CAC GTC CTC GAA AAA 288 
Pro Met Tyr Leu Asn He Gin Ser His Leu Tyr His Val Leu Glu Lys 

85 90 95 

ATA CAC AGG ACC CTG AAC GAC CGA GAC CGC TGG TCT CGG GCC TAC CGC 336 
He His Arg Thr Leu Asn Asp Arg Asp Arg Trp Ser Arg Ala Tyr Arg 

100 105 no 

GCG CGG AAA ACC CCT AAA TAA 357 
Ala Arg Lys Thr Pro Lys 
115 



(2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUELfR: 941 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 



(ix) CARACTERISTIQUE : 
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(A) NOM/CLE: exon 

(B) . EMPLACEMENT:! ..941 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 
GGCCGGCCGT CGACTGTGTG GGCGTGGCTT AAGGGTGGGA AAGAATATAT AAGGTGGGGG 60 
TCTTATGTAG TTTTGTATCT GTTTTGCAGC AGCCGCCGCC GCCATGTCCA CGAATTCCTT 120 
TGACGGCTCC ATCGTCTCCA GCTACCTGAC CACCCGGATG CCTCCCTGGG CTGGCGTCCG 180 
CCAAAACGTC ATGGGAAGCT CCATCGACGG CAGGCCTGTG CTCCCTGCCA ATAGCACCAC 240 
TCTGACTTAT GAAACTGTCA GCGGCACCCC ACTGGAAACC GCCGCAAGCG CTGCAGCCAG 300 
CGCTGCCGCC GCTACTGCTC GGGGCATCGT CACCGATTTC GCCTTTCTCT CCCCTCTGGC 360 
CTCCAGCGCT GCCAGCCGCA GCTCTGCTCG GGACGATAAA CTGACCGCCC TGCTGGCTCA 420 
GCTGGACAGC CTGACTAGGG AGCTGAACGT GGTGAGCCAA CAACTCCTGG ACCTCCGGCA 480 
ACAAGTGAGC GCTCTCAAAG CCTCTAGCCC ACCTAACGCC GTTTAAAACA TAAATAAAAA 540 
ACCAGACTCT GTTTGGATTT GGATCAAGCA AGTGTCTTGC TGTCTTTATT TAGGAGTTTT 600 
CCGCGCGCGG TAGGCCCGAG ACCAGCGGTC TCGGTCGTTC AGGGTCCTGT GTATTTTTTC 660 
GAGGACGTGG TAAAGGTGGC TCTGGATGTT CAGATACATA GGCATAAGCC CGTCTCTGGG 720 
ATGGAGGTAG CACCACTGGA GAGCTTCATG CTGCGGAGTG GTGTTGTAGA TAATCCAGTC 780 
GTAGCAGGAC CGCTGGGCGT GGTGCCTGAA AATGTCTTTC AGTAGCAGGC TGATTGCCAG 840 
GGGCAGTCCC TTGGTGTAAG TGTTTACGAA GCGGTTAAGC TGGGAGGGGT GCATACGTGG 900 
GGATATGAGA TGCATCTTGG ACTGTATTTT TAGGTTCGCG A 941 



(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 423 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADNc 
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(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:! . .423 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

ATG AGC ACG AAT TCG TTT GAC GGA AGC ATC GTC AGC TCA TAC TTG ACC 48 

Met Ser Thr Asn Ser Phe Asp Gly Ser He Val Ser Ser Tyr Leu Thr 

15 10 15 

ACG CGC ATG CCT CCC TGG GCC GGG GTG CGC CAG AAT GTC ATG GGC TCC 96 

Thr Arg Met Pro Pro Trp Ala Gly Val Arg Gin Asn Val Met Gly Ser 

20 25 30 

AGC ATT GAC GGT CGC CCT GTC CTG CCT GCA AAC TCT ACC ACT TTG ACC 144 

Ser He Asp Gly Arg Pro Val Leu Pro Ala Asn Ser Thr Thr Leu Thr 

35 40 45 

TAC GAA ACC GTG TCT GGC ACG CCG TTG GAA ACT GCA GCA TCC GCC GCC 192 

Tyr Glu Thr Val Ser Gly Thr Pro Leu Glu Thr Ala Ala Ser Ala Ala 

• 50 55 60 

GCT AGC GCC GCT GCA GCT ACC GCC CGC GGG ATC GTG ACT GAT TTT GCT 240 

Ala Ser Ala Ala Ala Ala Thr Ala Arg Gly He Val Thr Asp Phe Ala 

65 70 75 80 

TTT CTG AGC CCG CTT GCC AGC AGT GCA GCC TCC CGT TCA TCT GCC CGC 288 

Phe Leu Ser Pro Leu Ala Ser Ser Ala Ala Ser Arg Ser Ser Ala Arg 

85 90 95 

GAT GAC AAA TTG ACG GCT CTT CTG GCT CAG CTG GAT TCT TTG ACT CGG 336 

Asp Asp Lys Leu Thr Ala Leu Leu Ala Gin Leu Asp Ser Leu Thr Arg 

100 105 no 

GAA CTT AAC GTC GTT TCT CAG CAA CTG TTG GAC CTG CGC CAG CAA GTT 384 

Glu Leu Asn Val Val Ser Gin Gin Leu Leu Asp Leu Arg Gin Gin Val 

115 120 125 

TCT GCC CTC AAG GCT TCT TCC CCT CCC AAT GCC GTT TAA 423 

Ser Ala Leu Lys Ala Ser Ser Pro Pro Asn Ala Val * 

130 135 140 



(2) INFORMATIONS POUR LA SEQ ID NO: 4: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 141 acides amines 
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(B) TYPE: acide amine 

(D) CONFIGURATION; lineaire 

(ii) TYPE DE MOLECULE: prot^ine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

Met Ser Thr Asn Ser Phe Asp Gly Ser lie Val Ser Ser Tyr Leu Thr 
1.5 10 15 

Thr Arg Met Pro Pro Trp Ala Gly Val Arg Gin Asn Val Met Gly Ser 
20 25 30 

Ser lie Asp Gly Arg Pro Val Leu Pro Ala Asn Ser Thr Thr Leu Thr 
35 40 45 

Tyr Glu Thr Val Ser Gly Thr Pro Leu Glu Thr Ala Ala Ser Ala Ala 
50 55 60 

Ala Ser Ala Ala Ala Ala Thr Ala Arg Gly He Val Thr Asp Phe Ala 
65 70 75 80 

Phe Leu Ser Pro Leu Ala Ser Ser Ala Ala Ser Arg Ser Ser Ala Arg 

85 90 95 

Asp Asp Lys Leu Thr Ala Leu Leu Ala Gin Leu Asp Ser Leu Thr Arg 
100 105 110 

Glu Leu Asn Val Val Ser Gin Gin Leu Leu Asp Leu Arg Gin Gin Val 
115 120 125 

Ser Ala Leu Lys Ala Ser Ser Pro Pro Asn Ala Val * 
130 135 140 



(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 270 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 



( ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:] . ,270 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

ACC AAG GGC CTG CCC CTC GCA ATC AGC TTG CTA CTC AAA GAC ATT TTT 48 
Thr Lys Gly Leu Pro Leu Ala lie Ser Leu Leu Leu Lys Asp He Phe 
15 10 15 

AGG CAT CAC GCC CAG CGC TCC TGT TAG GAC TGG ATC ATC TAG AAT ACC 96 
Arg His His Ala Gin Arg Ser Cys Tyr Asp Trp He He Tyr Asn Thr 
20 25 30 

ACC CCG CAG CAT GAA GCC CTG CAG TGG TGC TAC CTG CAC CCC AGA GAC 144 

35 40 45 

GGG CTG ATG CCC ATG TAT CTG AAT ATC CAG AGT CAC CTT TAT CAC GTC 192 
Gly Leu Met Pro Met Tyr Leu Asn He Gin Ser His Leu Tyr His Val 
50 55 60 

CTG GAA AA.^ ATA CAT AGG ACC CTC AAC GAC CGA GAT CGC TGG TCC CGG 240 
Leu Glu Lys He His Arg Thr Leu Asn Asp Arg Asp Arg Trp Ser Arg 

70 75 Qo 

GCC TAT CGC GCG CGC AAA ACC CCT AAA TAA 270 
Ala Tyr Arg Ala Arg Lys Thr Pro Lys * 

85 90 



(2) INFORMATIONS POUR LA SEQ ID NO : 5: 

Ci) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 90 acides amines 

(B) TYPE; acide amine 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: prot , ine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

Thr Lys Gly Leu Pro Leu Ala He Ser Leu Leu Leu Lys Asp He Phe 
^5 10 15 

Arg His His Ala Gin Arg Ser Cys Tyr Asp Trp He He Tyr Asn Thr 
20 25 30 

Thr Pro Gin His Glu Ala Leu Gin Trp Cys Tyr Leu His Pro Arg Asp 
35 40 45 

Gly Leu Met Pro Met Tyr Leu Asn He Gin Ser His Leu Tyr His Val 
50 55 60 



Leu Glu 
65 



Lys He His Arg Thr Leu Asn Asp 
70 



Arg Asp Arg Trp Ser Arg 
75 80 
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Ala Tyr Arg Ala Arg Lys Thr Pro Lys * 

85 90 



(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 103 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 



( ix ) CARACTERISTIQUE : 

(A) NOM/CLE: - 

(B) EMPLACEMENT: 1 . . 103 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
GGCCGGCCGT CGACTGTGTG GGCGTGGCAT AAGGGTGGGA AAGAATATAT AAGGTCGGGG 60 
TCTCATCTAG TCTTGTATCT GATTTGCAGT AGCCGCCGCC ACC 103 



(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 52 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: - 

(B) EMPLACEMENT:! . .52 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 
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AGATCTCAAA TCAATAAATA AAGAAATACT TGTTATAAAA ACAAATGAAT GT 5- 

(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 847 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: - 

(B) EMPLACEMENT: 1 . .847 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

GGCCGGCCGT CGACTGTGTG GGCGTGGCAT AAGGGTGGGA AAGAATATAT AAGGTCGGGG 60 

TCTCATCTAG TCTTGTATCT GATTTGCAGT AGCCGCCGCC ACCATGAGCA CGAATTCGTT 120 

TGACGGAAGC ATCGTCAGCT CATACTTGAC CACGCGCATG CCTCCCTGGG CCGGGGTGCG 180 

CCAGAATGTC ATGGGCTCCA GCATTGACGG TCGCCCTGTC CTGCCTGCAA ACTCTACCAC 240 

TTTGACCTAC GAAACCGTGT CTGGCACGCC GTTGGAAACT GCAGCATCCG CCGCCGCTAG 300 

CGCCGCTGCA GCTACCGCCC GCGGGATCGT GACTGATTTT GCTTTTCTGA GCCCGCTTGC 360 

CAGCAGTGCA GCCTCCCGTT CATCTGCCCG CGATGACAAA TTGACGGCTC TTCTGGCTCA 420 

GCTGGATTCT TTGACTCGGG AACTTAACGT CGTTTCTCAG CAACTGTTGG ACCTGCGCCA 480 

GCAAGTTTCT GCCCTCAAGG CTTCTTCCCC TCCCAATGCC GTTTAAAGAT CTCAAATCAA 540 

TAAATAAAGA AATACTTGTT ATAAAAACAA ATGAATGTTT ATTTAGGGGT TTTGCGCGCG 600 

CGATAGGCCC GGG ACCAGCG ATCTCGGTCG TTGAGGGTCC TATGTATTTT TTCCAGGACG 660 

TGATAAAGGT GACTCTGGAT ATTCAGATAC ATGGGCATCA GCCCGTCTCT GGGGTGCAGG 720 

TAGCACCACT GCAGGGCTTC ATGCTGCGGG GTGGTATTGT AGATGATCCA GTCGTAACAG 780 
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GAGCGCTGGG CGTGATGCCT AAAAATGTCT TTGAGTAGCA AGCTGATTGC GAGGGGCAGG 840 
CCCTTGG Q47 



(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQQES DE LA SEQUENCE: 

(A) LONGUEUR: 44 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 



( ix ) CARACTERISTIQUE : 

(A) NOM/CLE: - 

(B) EMPLACEMENT : 1 . . 44 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 9: 



AACTGCAGGCCGGCCACTAGTCGCGATGTTCCCAGCCATATCCC 

(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 37 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: - 

(B) EMPLACEMENT;!.. 37 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 



CCGCTCGAGGTGACCGCTAGCCATTATGGACGAATGC 



10 



* 
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REVENDICATIONS 

1. Procede permettant de reduire la frequence des evenements de 
recombinaison homologue intra- ou intermoleculaire entre acides nucleiques 
caracterise en ce que la sequence de I'un au moins des acides nucleiques 
partenaires de la recombinaison est degeneree de maniere a reduire I'homologie 
avec le ou les autre(s) partenaires. 

2. Procede selon la revendication 1 caracterise en ce que la sequence est 
degeneree a raison de 1 paire de bases au moins toutes les 20 paires de bases. 

3. Procede selon la revendication 1 caracterise en ce que la sequence est 
degeneree a raison de 1 paire de bases au moins toutes les 10 paires de bases. 

4. Procede selon la revendication 1 caracterise en ce que la sequence est 
degeneree sur toutes les positions possibles. 

5. Procede selon la revendication 1 caracterise en ce que la degenerescence est 
realisee en fonction de I'usage des codons de la ceUule ou I'organisme chez 
lequel I'acide nucleique doit etre utilise. 

6. Procede selon la revendication 1 pour reduire la frequence des evenements 
de recombinaison homologue intermoleculaire entre un acide nucleique 
chromosomique et un acide nucleique extra-chromosomique. 

7. Procede selon la revendication 6 caracterise en ce que I'acide nucleique 
chromosomique code pour des fonctions de complementation d'un virus 
defectif et I'acide nucleique extra-chromosomique comprend le genome dudit 
virus defectif. 
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8. Procede selon la revendication 7 caracterise en ce que I'acide nucleique 
chromosomique comprend la region El d'un genome d'adenovirus ainsi qu'une 
region flanquante et Tacide nucleique extra-chromosomique comprend un 
genome d'adenovirus defectif pour la region El. 

9. Procede selon la revendication 8 caracterise en ce que la sequence du 
genome d'adenovirus defectif pour la region El est degeneree au niveau du 
gene pIX. 



10. Procede selon la revendication 9 caracterise en ce que la sequence du 
genome d'adenovirus defectif pour la region El est degeneree en outre au 
niveau du gene IVa2. 

11. Procede de preparation d'adenovirus recombinants defectif s par 
introduction, dans une ceUule de la lignee 293 ou dans une cellule derivee, du 
genome dudit adenovirus recombinant defectif, caracterise en ce que ledit 
genome porte : 

- une deletion de la region El 

- une degenerescence dans les genes pIX et/ou IVa2. 

12. Adenovirus recombinant defectif caracterise en ce que son genome 
comprend une region au moins dont la sequence est degeneree. 

13. Adenovirus selon la revendication 12 caracterise en ce que la region 
degeneree comprend le gene pIX. 

14. Adenovirus selon la revendication 13 caracterise en ce que la sequence 
degeneree du gene pIX est choisie parmi la sequence SEQ ID N"! ou la SEQ 
ID N°4. 
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15. Adenovirus selon les revendications 13 ou 14 caracterise en ce qu'en outre 
le gene IVa2 est present dans une position genomique autre que sa position 
d'origine, 

5 16. Adenovirus selon la revendication 15 caracterise en ce que le gene Iva2 est 
positionne au niveau de la region E4. 

17. Adenovirus selon la revendication 12 caracterise en ce que la region 
degeneree comprend les genes pIX et IVa2. 

10 

18. Adenovirus selon la revendication 17 caracterise en ce que la region 
degeneree est la sequence SEQ ID N'^S ou la sequence ID N^'S. 



15 



19. Adenovirus selon Tune des revendications 12-18 caracterise en ce qu'il 
comporte une deletion de la region El. 
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Figure 2 
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4703 base pairs 
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Figure 5 
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Figure 6 
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Degenerescence dans pIX 



GAC GGC TCC ATC 
GAT GGA AGC ATT 
asp gly ser ile 

31/11 

GTC TCC AGC TAC CTG ACC ACC CGG ATG CCT 
GTG AGC TCA TAT TTG ACA ACG CGC ATG CCC 
val ser ser tyr leu thr thr arg met pro 

61/21 

CCC TGG GCT GGC GTC CGC CAA AAC GTC ATG 
CCA TGG GCC GGG GTG CGT CAG AAT GTG ATG 
pro trp ala gly val arg gin asn val met 

91/31 

GGA AGC TCC ATC GAC GGC AGG CCT GTG CTC 

GGC TCC AGC ATT GAT GGT CGC CCC GTC CTG 

gly ser ser ile asp gly arg pro val leu 

121/41 

CCT GCC AAT AGC ACC ACT CTG ACT TAT GAA 
CCC GCA AAC TCT ACT ACC TTG ACC TAC GAG 

pro ala asn ser thr thr leu thr tyr glu 
151/51 

ACT GTC AGC GGC ACC CCA CTG GAA ACC GCC 
ACC GTG TCT GGA ACG CCG TTG GAG ACT GCA 
thr val ser gly thr pro leu glu thr ala 

181/61 

GCA AGC GCT GCA GCC AGC GCT GCC GCC GCT 
GCC TCC GCC GCC GCT TCA GCC GCT GCA GCC 

ala ser ala ala ala ser ala ala ala ala 

Figure 8a 



1/1 

ATG TCC ACG AAT TCC TTT 

ATG AGC ACC AAC TCG TTT 

Met ser thr asn ser phe 
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211/71 

ACT GCT CGG GGC ATC GTC ACC GAT TT£ GCC 
ACC GCC CGC GGG ATT GTG ACT GAC TTT GCT 

thr ala arg gly ile val thr asp phe ala 
241/81 

TTT CTC TCC CCT CTG GCC TCC AGC GCT GCC 

TTC CTG AGC CCG CTT GCA AGC AGT GCA GCT 

phe leu ser pro leu ala ser ser ala ala 

271/9.1 

AGC CGC AGC TCT GCT CGG GAC GAT AAA CTG 

TCC CGT TCA TCC GCC CGC GAT GAC AAG TTG 

ser arg ser ser ala arg asp asp lys leu 

301/101 

ACC GCC CTG CTG GCT CAG CTG GAC AGC CTG 
ACG GCT CTT TTG GCA CAA TTG GAT TCT TTG 

thr ala leu leu ala gin leu asp ser leu 
331/111 

ACT AGG GAG CTG AAC GTG GTG AGC CAA CAA 

ACC CGG GAA CTT AAT GTC GTT TCT CAG CAG 

thr arg glu leu asn val val ser gin gin 

361/121 

CTC CTG GAC CTC CGG CAA CAA GTG AGC GCT 
CTG TTG GAT CTG CGC CAG CAG GTT TCT GCC 
leu leu asp leu arg gin gin val ser ala 

391/131 

CTC AAA GCC TCT AGC CCA CCT AAC GCC GTT 
CTG AAG GCT TCC TCC CCT CCC AAT GCG GTT 

leu lys ala ser ser pro pro asn ala val 

421/141 

TAA 

TAA 

Figure 8b 
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Degenerescence dans IVa2 



1/1 

TC GCG AAC CTA AAA ATA CAG TCC AAG ATG 

TA GCC AAC CTA AAA ATA CAG TCC AAG ATG 

ile ala asn leu lys lie gin ser lys met 

31/11 

CAT CTG ATA TCC CCA CGT ATG CAC CCC TCC 

CAT CTC ATA TCC CCA CGT ATG CAC CCA TCC 

his leu ile ser pro arg met his pro ser 
61/21 

CAG CTT AAC CGC TTC GTA AAC ACT TAC ACC 

CAG CTT AAC CGC TTT GTA AAC ACT TAC ACC 

gin leu asn arg phe val asn thr tyr thr 

91/31 

AAG GGA CTG CCC CTG GCA ATC AGC CTG CTA 

AAG GGC CTG CCC CTG GCA ATC AGC TTG CTA 

lys gly leu pro leu ala ile ser leu leu 

121/41 

CTG AAA GAC ATT TTC AGG CAC CAC GCC CAG 

CTG AAA GAC ATT TTT AGG CAC CAC GCC CAG 

leu lys asp ile phe arg his his ala gin 
151/51 

CGG TCC TGC TAC GAC TGG ATT ATC TAC AAC 

CGC TCC TGC TAC GAC TGG ATC ATC TAC AAC 

arg ser cys tyr asp trp ile ile tyr asn 
181/61 

ACC ACT CCG CAG CAT GAA GCT CTC CAG TGG 

ACC ACC CCG CAG CAT GAA GCT CTG CAG TGG 

thr thr pro gin his glu ala leu gin trp 

Figure 9a 
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